其他
从IMGT数据库下载免疫组库相关fasta序列
前面我在生信技能树的推文教程:通过IMGT数据库认知免疫组库 提到了它是目前免疫组库相关fasta序列整理的最齐全的。(因为被黑粉举报,所以我们公众号时隔半个月才能继续发原创,让大家久等了) 真的是搞不明白,我辛辛苦苦写教程,为什么黑粉一定要无理取闹的举报!!!委屈
人类IGH的fasta文件下载
cd ~/biosoft/igblast/imgt
wget http://www.imgt.org/download/V-QUEST/IMGT_V-QUEST_reference_directory/Homo_sapiens/IG/IGHV.fasta
wget http://www.imgt.org/download/V-QUEST/IMGT_V-QUEST_reference_directory/Homo_sapiens/IG/IGHD.fasta
wget http://www.imgt.org/download/V-QUEST/IMGT_V-QUEST_reference_directory/Homo_sapiens/IG/IGHJ.fasta
IGHJ.fasta:13,6
IGHV.fasta:402,106
>J00256|IGHJ2*01|Homo sapiens|F|J-REGION|932..984|53 nt|2| | | | |53+0=53| | |
>J00256|IGHJ3*01|Homo sapiens|F|J-REGION|1537..1586|50 nt|2| | | | |50+0=50| | |
>X86355|IGHJ3*02|Homo sapiens|F|J-REGION|1107..1156|50 nt|2| | | | |50+0=50| | |
>J00256|IGHJ4*01|Homo sapiens|F|J-REGION|1912..1959|48 nt|3| | | | |48+0=48| | |
>X86355|IGHJ4*02|Homo sapiens|F|J-REGION|1480..1527|48 nt|3| | | | |48+0=48| | |
>M25625|IGHJ4*03|Homo sapiens|F|J-REGION|446..493|48 nt|3| | | | |48+0=48| | |
>J00256|IGHJ5*01|Homo sapiens|F|J-REGION|2354..2404|51 nt|3| | | | |51+0=51| | |
>X86355|IGHJ5*02|Homo sapiens|F|J-REGION|1878..1928|51 nt|3| | | | |51+0=51| | |
>J00256|IGHJ6*01|Homo sapiens|F|J-REGION|2947..3009|63 nt|3| | | | |63+0=63| | |
>X86355|IGHJ6*02|Homo sapiens|F|J-REGION|2482..2543|62 nt|3| | | | |62+0=62|partial in 3'| |
>X86356|IGHJ6*03|Homo sapiens|F|J-REGION|2482..2543|62 nt|3| | | | |62+0=62|partial in 3'| |
>AJ879487|IGHJ6*04|Homo sapiens|F|J-REGION|39..101|63 nt|3| | | | |63+0=63| | |
进行多序列比对,查看它们的远近关系
clan I: IGHV1, IGHV5 and IGHV7 subgroup genes clan II: IGHV2, IGHV4 and IGHV6 subgroup genes clan III: IGHV3 subgroup genes
AB019437 (200000 bp): IGHV(III)-82 to IGHV(II)-60-1 AB019438 (200000 bp): IGHV3-60 to IGHV4(II)-40-1 AB019439 (200000 bp): IGHV7-40 to IGHV3-21 AB019440 (200000 bp): IGHV(II)-20-1 to IGHV2-5 AB019441 (157090 bp): IGHV4-4 to IGHV6-1
library(msa)
library(ggtree)
library(seqinr)
mySequences <- readDNAStringSet('IGHJ.fasta')
mySequences
myAlignment <- msa(mySequences)
msaR(AAStringSet(as.character(myAlignment)))
文末友情宣传
生信爆款入门-全球听(买一得五)(第5期)(可能是最后一期)你的生物信息学入门课 (必看!)数据挖掘第3期(两天变三周,实力加量),医学生/临床医师首选技能提高课 生信技能树的2019年终总结 ,你的生物信息学成长宝藏 2020学习主旋律,B站74小时免费教学视频为你领路,还等什么,看啊!!!